AI资讯新闻榜单内容搜索-deepseek V

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: deepseek V
刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座

刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座

刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座

原生多模态Llama 4终于问世,开源王座一夜易主!首批共有两款模型Scout和Maverick,前者业界首款支持1000万上下文单H100可跑,后者更是一举击败了DeepSeek V3。目前,2万亿参数巨兽还在训练中。

来自主题: AI技术研报
9514 点击    2025-04-06 18:06
7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?

7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?

7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?

语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。在生成模型发展早期,这种刻板印象广泛存在于很多研究者的脑海中。

来自主题: AI技术研报
7133 点击    2025-04-06 16:48
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

685B的DeepSeek-V3新版本,就在昨夜悄悄上线了。参数量685B的V3,代码数学推理再次显著提升,甚至代码追平Claude 3.7,网友们实测后大呼强到离谱!有人预测说,按照此前的节奏,DeepSeek-R2大概率几周内就将上线。

来自主题: AI技术研报
10760 点击    2025-03-25 12:09
实测完DeepSeek发布的新模型,我觉得AI编程的全民普惠时刻到来了。

实测完DeepSeek发布的新模型,我觉得AI编程的全民普惠时刻到来了。

实测完DeepSeek发布的新模型,我觉得AI编程的全民普惠时刻到来了。

DeepSeek深夜偷袭。昨天晚上,他们的v3模型,有了一波更新,版本号到了DeepSeek-V3-0324,而且是直接开源的。

来自主题: AI资讯
10311 点击    2025-03-25 08:49
8卡32B模型超越o1预览版、DeepSeek V3,普林斯顿、北大提出层次化RL推理新范式

8卡32B模型超越o1预览版、DeepSeek V3,普林斯顿、北大提出层次化RL推理新范式

8卡32B模型超越o1预览版、DeepSeek V3,普林斯顿、北大提出层次化RL推理新范式

推理大语言模型(LLM),如 OpenAI 的 o1 系列、Google 的 Gemini、DeepSeek 和 Qwen-QwQ 等,通过模拟人类推理过程,在多个专业领域已超越人类专家,并通过延长推理时间提高准确性。推理模型的核心技术包括强化学习(Reinforcement Learning)和推理规模(Inference scaling)。

来自主题: AI技术研报
6695 点击    2025-02-12 11:33
腾讯云X DeepSeek:API调用+联网搜索,分钟打造企业级 AI 应用

腾讯云X DeepSeek:API调用+联网搜索,分钟打造企业级 AI 应用

腾讯云X DeepSeek:API调用+联网搜索,分钟打造企业级 AI 应用

刚刚,腾讯云再放大招——不仅上线了 DeepSeek-R1 和 V3 原版模型的 API 接口,还将它们接入了大模型知识引擎,并支持联网搜索,成为国内率先实现这一能力的云厂商。

来自主题: AI资讯
8230 点击    2025-02-08 17:25
超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈

超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈

超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈

2024年11月,艾伦人工智能研究所(Ai2)推出了Tülu 3 8B和70B,在性能上超越了同等参数的Llama 3.1 Instruct版本,并在长达82页的论文中公布其训练细节,训练数据、代码、测试基准一应俱全。

来自主题: AI技术研报
7165 点击    2025-02-05 16:54
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

昨晚,杭州大模型又双叒不睡,给大伙儿拜年啦~就在春晚直播进行时,阿里通义Qwen发布新春节礼第三弹:Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡DeepSeek V3。

来自主题: AI资讯
7149 点击    2025-01-29 12:40